Dla wybranej obserwacji ze zbioru danych wylicz predykcję modelu

Do zadania został użyty model regresji logicznej. Przglądając różne obserwację otrzymywałam takie wyniki jak: 0,34; 0,76; 0,98. My przyjrzymy się obserwacji o indexie 4, której predykcja wynosi ok.0.84.

Dla wybranej obserwacji z punktu 1., wylicz dekompozycję predykcji modelu

Dla obserwacji o indexie 4 największą udział w predykcji mają zmienne:

Wybierz dwie obserwacje ze zbioru danych, które mają inne najważniejsze zmienne

Pierwszy:

Drugi:

Dla pierwszej obserwacji zmienna Total_Revolving_Bal ma dużo większy udział niż dla drugiej. Klienci posiadający saldo zerowe nie mogą korzystać z usługi, co może być dużą motywacją do rezygnacji z konta. Wsród zmienych mający często duży udział w predykcji, największym udział dla konkretnej obserwacji mają zmienne, które przyjmują wartości brzegowe/ odchylone od średniej.

Tak jak wcześniej zauważyłam, zmienne ktróe przyjmują swoje wartości brzegowe jak np. Total_Relationship_Count, mają dużą kontrybucję. Dodatkowo dla tej zmiennej można by przypuszczać że, to czy kontrybucja jest dodatnia lub ujemna zależy od tego którą wartość brzegową przyjmiemy - 1 lub 5. Podobnie wygląda to dla zmiennej Total_Trans_Amt. Przyjrzyjmy się także zmiennej Months_Inactive_12_mon. W obu przypadkach przyjmuję ona wartość 3, a jej kontrybucja wynosi -0.018 w pierwszym i -0.2 w drugi.Są to wartości podobne, ale nie identyczne.